Correspondances compatibles avec les fichiers inverses pour la recherche d'information
نویسندگان
چکیده
RÉSUMÉ. Cet article fait un retour sur l’un des éléments majeurs d’un système de recherche d’information : la correspondance basée sur des fichiers inverses car le passage d’une formule théorique à une implantation compatible avec des fichiers inverse est rarement explicitée dans les publications. Nous proposons ici de définir plus formellement l’expression d’une formule de correspondance compatible avec des fichiers inverses. Nous proposons deux niveaux de compatibilité. Nous étudions les modèles les plus classiques en vérifiant leur compatibilité avec les fichiers inverses. Nous explorons la traduction d’une correspondance de Jensen-Shannon, initialement non-compatible avec les fichiers inverses, vers deux formules compatibles avec les fichiers inverses à chaque niveau. Une expérimentation simple, sur un corpus d’images, montre que la classique Divergence de Kullback-Leibler obtient des résultats moins bons que la Divergence de Jensen-Shannon compatible avec des fichiers inverses.
منابع مشابه
Un modèle de classement de services par contribution et utilité
Résumé Les architectures orientées services (AOS) se sont imposées pour la construction d’applications web grâce à l’élaboration de standards ouverts et compatibles avec les technologies web existantes. Le nombre de services sur le web grandit chaque jour et les développeurs d’applications sont souvent confrontés au problème de choisir parmi les services disponibles. Cet article présente un mod...
متن کاملRecherche d'images par l'analyse factorielle des correspondances
RÉSUMÉ. On utilise l’analyse factorielle des correspondances (AFC) pour la recherche d’images par le contenu en s’inspirant directement de son utilisation en analyse des données textuelles (ADT). En ADT, l’AFC est appliquée à un tableau de contingence croisant mots et documents. La première étape consiste donc à établir des « mots visuels » dans les images (analogue des mots dans les textes). C...
متن کاملUne nouvelle approche pour la recherche d'images par le contenu
Résumé. On utilise l’analyse factorielle des correspondances (AFC) pour la recherche d’images par le contenu en s’inspirant directement de son utilisation en analyse des données textuelles (ADT). L’AFC permet ici de réduire les dimensions du problème et de sélectionner des indicateurs pertinents pour la recherche par le contenu. En ADT, l’AFC est appliquée à un tableau de contingence croisant m...
متن کاملUne Architecture Basée Agents Mobiles Pour la Recherche d'Information dans des Sources Hétérogènes et Réparties
Résumé. De nos jours le besoin en information devient très exigeant et l'interopérabilité des systèmes devient une approche incontournable. Une demande d'information peut être répartie sur plusieurs systèmes répartis d'où la nécessité d'une reconstitution de la réponse par une entité gérante. D'autre part, les échanges des données et la répartition des tâches d'une application distribuée nécess...
متن کاملUn modèle de recherche d'information collaborative basé sur l'expertise des utilisateurs
RÉSUMÉ. Dans ce papier, nous nous intéressons à un contexte de recherche d’information collaborative où les utilisateurs sont caractérisés par différents niveaux d’expertise du sujet de la requête. Nous proposons un modèle d’ordonnancement de documents intégrant les rôles d’expert et de novice tenant compte de la spécificité de chacun des rôles et assignant un document à l’utilisateur le plus à...
متن کامل